En kambrisk informasjons-eksplosjon
(Fritt utvalg fra Darwins Doubt; S.C.Meyer, Harper One, 2013, Ch.8-9) {med oversetters kommentar i klamme-parentes}
Da forfatteren (S.C.Meyer) var college professor, spurte han studentene hva som trengtes for å for at en PC kunne oppnå ny funksjonalitet. De fleste fant fort ut at informasjon var ett nødvendig kriterium. Vi skal i det videre se på årsaker til kambrisk eksplosjon. Ut fra hvilke midler eller prosesser, kunne såpass komplekse dyr som oppsto i kambrium bli til?
Som Darwin så for seg, kunne ikke naturlig seleksjon avstedkomme noe, uten en stadig forsyning av variasjon, som kilde for ny biologisk informasjon. Bare etter at nyttige variasjoner er oppstått, kan naturlig seleksjon sile vekk variasjon, som ikke innebærer noen fordel. Dette innså faktisk mange ledende vitenskapsfolk allerede på slutten av 1800-tallet. Mellom 1870 og 1920 gikk klassisk darwinisme inn i en nedgangsperiode, fordi mange vitenskapsfolk ikke mente at den kunne forklare opphavet og overføring av ny arvelig informasjon. (1) Før Mendels arvelære, var rådende oppfatning en form for 'blanding/kompromiss' mellom arveanlegg. Det ville innebære for lite variasjon for naturlig seleksjon å virke på. Også etter Mendels lære ble kjent, var det skepsis til hvorvidt en betydelig, men likevel begrenset mengde genetisk variasjon kunne oppstå ved genetisk reproduksjon, under seksuell reproduksjon. Etter forsøk med radioaktiv stråling av bananfluer, der en framkalte 'monstre' av genetisk variasjon, så var det i teorien åpning for en stor mengde variasjon, som naturlig seleksjon kunne bearbeide. På hundre-årsjubileet til 'Artenes opprinnelse', hevdet Julian Huxley (sønnesønn av Th: Huxley) at de ikke lenger trengte bekymre seg for å etablere ' evolusjon som et faktum.' (8)
Selv etter oppdagelsen av DNA ved Watson og Crick (1953), så ble det stilt skeptiske spørsmål til hvordan nødvendig informasjon -for å bygge fullstendig nye kroppsformer, kunne oppstå i løpet av biologisk evolusjon. Var mutasjoner tilstrekkelige for å danne nødvendig variasjon -i så måte? En måte å skille kompleksitet hos ulike dyreformer, er ved antall celletyper de innehar. {Mennesket har over 220 ulike celletyper, alt med likt DNA (genom), mens epigenetikken er ulik i celletypene -oversetters tilføyelse.} Biologisk kompleksitet økte i løpet av kambrium fra anslagsvis 10 til 50 ulike celletyper hos leddyr, og 60 hos fisker. Forut for det hadde det i løpet av ca. 3 milliarder år vært lite mer enn encellede organismer (bakterier og alger) (12). Så for omkring 555 til 570 millioner år siden, dukket de første komplekse organismene opp i fossiler, inklusive svamper og Ediacran biota -se bilde 1 (13). Antall celletyper undervurderer dessuten kraftig forskjellen i kroppsformer (kroppsplaner). (16)
Bilde 1. Ediacran biota
En måte å estimere mengden av ny genetisk informasjon, består i å måle størrelse av genomet hos moderne representanter av dyr som dukket opp i kambriske grupper, og sammenligne det med informasjonsmengden i enklere livsformer. Moderne molekylær-biologer har estimert at en middels kompleks encellet organisme består av mellom 318 til 562 -tusen DNA-basepar, for å produsere nødvendige proteiner for liv (17). Mer komplekse encellede organismer kan trenge opptil en million DNA-basepar (18). For å danne tilstrekkelig proteiner til å opprettholde et komplekst leddyr, som en trilobitt, ville en behøve flere størrelsesordener flere protein-kodende instruksjoner. Overgang fra encellede dyr til kolonier av celler innebærer således betydelige, og i prinsippet målbare mengder av informasjon.
I løpet av den kambriske perioden oppstå et veritabelt 'sirkus' av ny biologiske dyreformer. Men fordi nye genetiske former krever nye celletyper, proteiner og genetisk informasjon, så genererte den kambriske eksplosjon også en inntil da ikke-overgått eksplosjon av genetisk informasjon (19). Å danne en ny kroppform krever også en annen type informasjon, som kalles epigenetisk informasjon -og ikke er laget i gener (se kap. 13-14). For å se om neo-darwinistiske mekanismer kan forklare den dramatiske økning av genetisk informasjon som inntreffer i Kambrium, skal vi se på informasjonsbegrepet og identifisere den type informasjon som DNA inneholder.
Biologisk informasjon: Shannon-informasjon eller ikke?
Vitenskapsfolk gjenkjenner typisk to basis-typer av informasjon, funksjonell (eller meningsfull informasjon) og såkalt 'Shannon-informasjon'. Skjelningen har oppstått delvis ut fra utvikling i en gren av anvendt matematikk, såkalt informasjonsteori. På slutten av 1940 tallet utviklet matematikeren Claude Shannon, en matematisk informasjonsteori. Shannon satte likhetstegn mellom informasjonsmengden som ble overført ved en sekvens av tegn, med graden av usikkerhet som ble redusert eller eliminert ved overføring av denne sekvensen (20). Shannon tenkte at en kommunikasjon som ikke eliminerte mye usikkerhet, også var lite informativ. Om f.eks. en fotballreporter før en kamp sier at et lag vil prøve å skyte ballen i mål og hindre mål i mot, så er ikke det noen ny informasjon. Shannons teori kvantifiserte den intuitive sammenhengen mellom redusert usikkerhet og informasjon, ved å bekrefte at dess mer usikkerhet en begivenhet eller kommunikasjon eliminerer, dess mer informasjon formidler den. Om et fotballag f.eks. har 4 spisser, med ulik spillestil, så vil det å offentliggjøre hvilken spiss man benytter, redusere usikkerhet hos motstanderlaget. Sannsynligheten for at hver av dem spiller, er i utgangspunktet 1:4. Om motstanderlaget bare har 2 alternative spisser, så innebærer sjanse for at hver av dem spiller, å være 1:2. Dess mer usannsynlig det var at en spiss spilte, desto større usikkerhet ble redusert ved offentliggjøring. Således førte offentliggjøring av spissvalg i det første laget, til mer ny informasjon enn for det andre.
Bilde 2. Mulig å få noe informasjon?
Biologer kan benytte Shannon-informasjon til å måle mengden av Shannon-informasjon i en DNA-streng. DNA formidler informasjon i Shannon betydningen, ved at det inneholder lange usannsynlige arrangement av 4 kjemikalier: De fire basene: adenin, tymin, guanin og cytosin (A,T,G og C). Francis Crick innså at disse basene formulerte alfabetiske eller digitale tegn i en streng. Siden hver av dem har en lik sjanse på 1:4 til å inntreffe, kan biologer kalkulere sannsynligheten (informasjonsbærende kapasitet), til hvilken som helst streng med lengde n. F.eks. har enhver streng med lengde 3, har en sannsynlighet på 1: 4*4*4= 1: 64 (1000000 -digitalt) på å inntreffe -som tilsvarer 6 bit {-når en kan representere én av dem som 0}. (Hver DNA-base inneholder 2 biter av informasjon, siden 4=100-digitalt) Selv om Shannon-informasjon kan være nyttig ut fra IT-synspunkt, skjelner den ikke mellom meningsfull informasjon og meningsløse sekvenser. En vanlig setning utfører et kommunikasjonsformål, mens meningsløse sammenstillinger ikke gjør det. Både Shannon og hans medarbeider Weaver understreket at shannon-informasjon trenger å skjelnes fra vår vanlige forståelse av informasjon (23). Med vanlig forståelse siktes det selvsagt til meningsfull eller funksjonell kommunikasjon. Websters ordbok definerer informasjon som "kommunikasjon eller mottakelse av kunnskap eller intelligens."
DNA har informasjonsbærende kapasitet eller evne, som er målbart ved shannon-teori (24). Men DNA inneholder også funksjonell informasjon (25). I vanlige språk overbringer spesifiserte sammenstilte strenger funksjonell informasjon til bevisste agenter. I en PC kan strenger av binær kode bearbeides til å gi et funksjonelt resultat, uten at bevisste agenter overvåker selve behandlingen. På samme måte lagrer og overbringer DNA for å danne proteiner eller RNA molekyler, selv om det ikke mottas av en bevisst agent. Som i programkode tillater arrangering av kjemikalier å 'produsere en spesifikk effekt'. Av den grunn liker forfatteren (S.C.Meyer) begrepet spesifisert informasjon, som synonym for funksjonell informasjon. Det er fordi funksjonen til en sekvens av kjemikalier, avhenger av den spesifiserte arrangeringen av disse kjemikaliene.
Så om opphavet til kambriske dyr krevde store mengder med ny spesifisert, funksjonell informasjon: Hva produserte denne informasjons-økingen? Spesifisering av arrangement av DNA-basene kjennetegner genetisk tekst mer enn usannsynlighet. Den kambriske eksplosjonen stiller spørsmålet på spissen: er det rimelig å forvente at naturlig seleksjon som virker på tilpassede tilfeldige, genetiske variasjoner og mutasjoner, kan gi de høyst spesifiserte arrangement av nødvendige baser for å generere proteiner til nye celletyper og livsformer?
Kap. 9 Kombinatorisk inflasjon
I 1966 samlet en gruppe av matematikere, ingeniører og vitenskapsfolk til en konferanse ved Wistar instituttet i Philadelphia: "Matematiske utfordringer til neo-darwinsk fortolkning av evolusjon." For mange av deltakerne, stammet tvilen mht. til den kreative kraften til mutasjoner og seleksjonsmekanismer, fra klargjøringen av naturen til genetisk informasjon i løpet av sent 1950 og tidlig 1960-tall. Oppdagelsen av at genetisk informasjon er laget som en lineær streng, hjalp først til å klargjøre naturen til mange mutasjonsprosesser. Ikke bare punktmutasjoner, men dupliseringer, innsettinger, inversjoner, rekombinasjoner og sletting av hele sekvenser av genetisk informasjon. En av initiativtakerne til konferansen, Murray Eden, var klar over disse alternativene, men argumenterte likevel for at tilfeldige endringer ville degradere funksjonen til informasjonsbærende sekvenser. Han argumenterte for at spesifikk arrangering av funksjonelle DNA-baser høyst sannsynlig ville ødelegge deres funksjonalitet, mens tilfeldige forsøk på å danne nye seksjoner av genetisk kode, sannsynligvis ville være dømt til å mislykkes (5).
Grunnen til denne nedgang i funksjonalitet, finnes i en matematikk-gren som kalles kombinatorikk. Her studeres antall måter en gruppe kan kombineres eller arrangeres. Ett eks. kan være en kodelås med 3 siffer. Her kan det dannes: 10*10*10=1000 ulike koder. Tilsvarende har en kodelås med 5 siffer mulighet til å romme: 10*10*10*10*10=100.000 ulike koder. Deltakerne ved Wistar innså at mutasjons- og seleksjons-mekanismene møtte ett tilsvarende problem. Om celler involvert i replikasjon på noe tidspunkt akkumulerte en 'rett' kombinasjon av mutasjoner, så ville informasjon for å danne ett nytt protein overbringes til neste generasjon. Om det proteinet tilførte individet en bedre sjanse for å overleve, vil naturlig seleksjon sørge for at det tenderer til å favoriseres. Evolusjonsbiologer anerkjenner typisk at mutasjoner, ikke naturlig seleksjon, forsyner kilden til variasjon og innovasjon i den evolusjonære prosessen. To biologer formulerte det slik: "Naturlig seleksjon er redaktøren, heller enn komponisten av det genetiske materialet." (6)
Det var kjernen i problemet slik deltakerne ved Wistar så det: For hver sekvens av aminosyrer som genererer en funksjonelt protein, så er det myriader av kombinasjoner som ikke gjør det. I det kompleksitet av nødvendig protein øker, så øker antall mulige kombinasjoner eksponentielt. De informasjonsbærende sekvenser i DNA består av spesifikke arrangement av de fire basene (A,C, T og G). For to baser, er det: 4*4=16 (4 opphøyd i 2) mulige kombinasjoner, for tre baser, er det: 4*4*4=64 (4 opphøyd i 3). For 100 baser er det 4 opphøyd i 100, som tilsvarer 10 opphøyd i 60 mulige måter å arrangere 100 baser på rad. De fleste gener, seksjoner av DNA som koder for ett spesifikt protein, består av minst 1000 baser. Det tilsvarer 4 opphøyd i 1000 mulige kombinasjoner, som er ett svimlende høyt tall. Tilsvarende gjelder for aminosyre kjeder: 3 baser går sammen i å forme ett kodon, for å danne én av de 20 protein-dannende aminosyrene. Om ett gjennomsnittlig gen har 1000 baser tilsvarer det over 300 (333) aminosyrer. En kjede av to aminosyrer kan danne: 20*20= 400 (20 opphøyd i 2) kombinasjoner. For tre aminosyrer så kan det dannes: 20*20*20= 8000 (20 opphøyd i 3) kombinasjoner. For fire aminosyrer så kan det dannes: 20*20*20*20= 160. 000 (20 opphøyd i 4) kombinasjoner etc. Proteiner krever typisk hundrevis av aminosyrer for å utøve sine funksjoner. For 300 aminosyrer, blir det 20 opphøyd i 300 eller mer enn (10 opphøyd i 390) mulige aminosyre-sekvenser i på den lengden. For å sette slike tall i relieff, så er det (10 opphøyd i 65 atomer) i Melkeveien, og (10 opphøyd i 80) elementærpartikler i det kjente univers.
Bilde 3. DNA med sine baser -samt sukker/fosfat-strenger
Deltagerne ved Wistar innså at om mutasjoner i seg selv var tilfeldige, d.v.s. at de verken ble styrt av en intelligens eller slik som neo-darwinismen forutsetter: ikke ble influert av funksjonelle behov hos organismen, så ville sannsynligheten for at mutasjoner og seleksjonsmekanismer noensinne produserte ett nytt gen eller protein, være forsvinnende liten. Mutasjonene måtte ved prøving og feiling søke gjennom ett enormt antall muligheter, mange flere enn realistisk på tiden tilgjengelig for evolusjonære prosesser. Eden påpekte at for ett protein av gjennomsnittlig lende, 250 aminosyrer, så ville det være 20 opphøyd i 250 mulige kombinasjoner, som tilsvarer . Hadde mutasjons og seleksjonsmekanismene tid nok, siden universets begynnelse til å gjennomsøke mer enn en brøkdel av disse mulighetene? For Murray Eden ble svaret klart nei. En annen av deltagerne, Schützenberg, understreket at tilfeldig å kutte og lime større DNA-sekvenser, slike evolusjonsbiologer ofte forestiller seg, heller ikke ville gjøre noen effektfull forandring i forhold til tilfeldig utsøking av sekvensrommet. Han mente at å tilfeldig 'skuffe' blokker av DNA-baser, uunngåelig ville medføre redusert funksjonalitet, på samme måte som individuelle base-substitusjoner ville gjøre det. Fysiker St. Ulam påpekte at den evolusjonære prosessen krevde tusenvis, kanskje millioner av suksessive mutasjoner, for å danne selv de enkleste av de komplekse former vi nå ser i live. Selv om sannsynligheten for én enkeltmutasjon er så stor som 1/2, så ville en million påfølgende mutasjoner, gi en sannsynlighet så nær 0 at sjansene for en slik kjede, i praksis ville være ikke-eksisterende (9).
På leting etter forholdet
En kom til slutten av 1980-tallet og tidlig 1990-tall, før Robert Sauer, molekylær biolog ved MIT utførte en serie eksperimenter som først forsøkte å måle proteiners sjeldenhet blant mulig utfallsrom for aminosyre-sekvenser. I løpet av 1970 og 1980-tallet utviklet molekylær-biologer teknikker for å lage tilpassede syntetiske DNA-molekyler. Robert Sauer benyttet disse teknikken for å danne DNA-endringer i spesifikke gener med kjente funksjoner, som han så injiserte varianter av i bakterie-celler. Han kunne da evaluere effekten av ulike målstyrte endringer av en DNA-sekvens på funksjonen av deres proteinprodukter, innenfor en bakteriell cellekultur. Han kunne da begynne å evaluere hvor stor prosentandel , som likevel produserte en funksjonell form av relevant protein. Hans initielle resultater foreslo at proteiner faktisk kunne tolerere en variasjon av aminosyrer, og dessuten at funksjonelle proteiner var utrolig sjeldne i rommet av alle mulige aminosyre-sekvenser (omkring 1: ) for et protein på 92 aminosyrers lengde.) (14)
Bilde 4. Eks. på forhold ved fungerende proteiner (Douglas Axe)
De to funnene kan synes å være i motstrid med hverandre, men la oss ta ett eks. som viser hvordan det kan kombineres. Om en istedenfor å ha en kodelås med 10 mulige antall siffer, anskaffer en med 100 siffer, så vil antallet kombinasjonsmuligheter stige enormt: Om det for hvert tegn er 20 ulike muligheter, så vil antallet tilsvare 20 opphøyd i 100, som tilsvarer . Om det derimot er slik at 4 av 20 mulige tegn på låsen kan fungere, så er det 4 opphøyd i 100, eller rette kombinasjoner. Sannsynligheten for å velge en rett kombinasjon, vil likevel være ekstremt liten: 1: . Dette resultatet var i grov overensstemmelse med et tidligere estimat av informasjonsteoretikeren Hubert Yockey (15). For en illustrativ leksjon i antall kombinasjoner, se her (lenke).
Referanser:
Kap 8.
1. Bowler, Theories of Human Evolution, s.44-50
8. Huxley quoted in "'At Random': A Television Preview," s.45
12. Brocks et al, "Archean Molecular Fossils and the Early Rise of Eukaryotes."
13. Grotzinger et al, "Biostratigraphic and Geochronologic Constraints on Early Animal Evolution."
14.
16. Valentine, "Origin of the Phyla", s.73
17. Koonin, "How Many Genes can Make a Cell?"
18. Gerhardt og Kirschner, Cells, Embryos and Evolution, s121
19. I tillegg til å kreve store mengder genetisk informasjon, vil det å bygge ett nytt dyr, også kreve en måte å arrangere proteinene i høyere nivås organisering, inkl. celletyper og kroppsplaner. Se Kap. 13-14.
20. Shannon, "A Mathematical Theory of Communication."
23. Yockey, Information Theory and Molecular Biology, s.110
24.Schneider, "Information Content of Individual Genetic Sequences"; Yockey, Information Theory and Molecular Biology, s.58-117
25. Alle tegnsekvenser kan bli skjelnet fra Shannon-informasjon , i at den presise arrangeringen av tegn/symboler påvirker funksjonsevnen de utfører.
Kap. 9:
1. Eden, "Inadequacies of Neo-Darwinian evolution as a Scientific Theory," s.11
5. David Berlinski utvidet Edens argument: Hvordan det enn kan operere i livet, er tilfeldighet i språk en fiende av orden, en måte å ødelegge mening på. Og det gjelder ikke bare i språk, men i ethvert språk(kode)lignende system. ("The Deniable Darwin")
6. King and Jukes, "Non-Darwinian Evolution", s.788
9. Ulam, "How to Formulate Mathematically problems of Rate of Evolution," s.21
14. Reidhaar-Olsen og Sauer, "Functionally Acceptable Substitutions int Two Alpha-Helical Regions of Lambda Repressor."
15. Yockey, "On the Information Content of Cytochrome C."
Oversettelse samt utvalg av stoff og bilder ved Asbjørn E. Lund